Análisis del desempeño del algoritmo genético en la clasificación automática de documentos
نویسندگان
چکیده
Resumen. Existen diversos algoritmos de clasificación para el proceso de clasificación automática de documentos, estos algoritmos buscan soluciones eficientes y rápidas, es por lo cual, el Algoritmo Genético es ideal para aplicar a este contexto, ya que es capaz de encontrar soluciones eficientes en unos cuantos segundos, por su capacidad de examinar el espacio de búsqueda en forma amplia y eficiente. Este Artículo se centra principalmente en analizar el desempeño del Algoritmo Genético para la clasificación automática de documentos. En este artículo se analizó el desempeño que tiene el algoritmo OlexGA, que posee como base un Algoritmo Genético, mediante diversas pruebas de minería de datos.
منابع مشابه
Clasificación semántica de textos no estructurados mediante un enfoque evolutivo
Resumen. En la actualidad, cerca del 90% de la información se encuentra plasmada tanto en documentos estructurados como no estructurados. Esto ha dado impulso a la investigación e implementación de diferentes algoritmos para el análisis y clasificación de textos de acuerdo a su orientación semántica. Por ello, en el presente trabajo se describe una manera de clasificación de textos no estructur...
متن کاملDiseño automático de redes neuronales artificiales mediante el uso del algoritmo de evolución diferencial (ED)
Resumen—En el área de la Inteligencia Artificial, las Redes Neuronales Artificiales (RNA) han sido aplicadas para la solución de múltiples tareas. A pesar de su declive y del resurgimiento de su desarrollo y aplicación, su diseño se ha caracterizado por un mecanismo de prueba y error, el cual puede originar un desempeño bajo. Por otro lado, los algoritmos de aprendizaje que se utilizan como el ...
متن کاملÁrbol de decisión C4.5 basado en entropía minoritaria para clasificación de conjuntos de datos no balanceados
Resumen. En el área de aprendizaje automático, el problema de desbalance en los datos es uno de los más desafiantes. Desde hace más de una década, se han desarrollado nuevos métodos para mejorar el desempeño de los métodos de clasificación para este tipo de problema. En este art́ıculo se presenta una modificación al algoritmo C4.5 usando el concepto de entroṕıa minoritaria. La propuesta está bas...
متن کاملDesarrollo de un sistema para medir similitud entre clases
Resumen. El incremento continuo de información en formato digital obliga a contar con nuevos métodos y técnicas para acceder, recopilar y organizar estos volúmenes de información textual. Una de las técnicas más utilizadas para organizar dicha información es la clasificación de documentos. Los sistemas de clasificación automática de textos tienen una baja eficiencia cuando las clases son muy pa...
متن کاملUnderstanding the Performance of Statistical MT Systems: A Linear Regression Framework
We present a framework for the analysis of Machine Translation performance. We use multivariate linear models to determine the impact of a wide range of features on translation performance. Our assumption is that variables that most contribute to predict translation performance are the key to understand the differences between good and bad translations. During training, we learn the regression ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Research in Computing Science
دوره 93 شماره
صفحات -
تاریخ انتشار 2015